Bases de Dados. Dados do PPBio Semiárido

Exemplos de conjunto de dados ecológicos do Programa de Pesquisa em Biodiversidade (PPBio) do Semiárido

Autores

Prof. Elvio S. F. Medeiros

Laboratório de Ecologia

Universidade Estadual da Paraíba

Campus V, João Pessoa, PB

Data de Publicação

17 de janeiro de 2026

Resumo
Para entender a distribuição das espécies de peixes e seu uso de habitat, uma série de variáveis ambientais foram avaliadas como preditores da composição e riqueza da assembleia de peixes em sistemas aquáticos tropicais semiáridos. Nós pesquisamos a composição de espécies de assembleias de peixes em sistemas aquáticos semiáridos e estabelecemos seu grau de associação com a estrutura do habitat aquático. Os locais consistiam em trechos de riachos com fluxo de água superficial, poças temporárias isoladas e reservatórios artificiais (açudes). A amostragem de peixes foi realizada em quatro ocasiões durante as estações chuvosa (abril e junho de 2006) e seca (setembro e dezembro de 2006).

1 Apresentação

Para entender a distribuição das espécies de peixes e seu uso de habitat, uma série de variáveis ambientais foram avaliadas como preditores da composição e riqueza da assembleia de peixes em sistemas aquáticos tropicais semiáridos. Nós pesquisamos a composição de espécies de assembleias de peixes em sistemas aquáticos semiáridos e estabelecemos seu grau de associação com a estrutura do habitat aquático. Os locais consistiam em trechos de riachos com fluxo de água superficial, poças temporárias isoladas e reservatórios artificiais (açudes). A amostragem de peixes foi realizada em quatro ocasiões durante as estações chuvosa (abril e junho de 2006) e seca (setembro e dezembro de 2006).

Palavras-chave: rios intermitentes, reservatórios, conservação, composição de substratos.

2 Sobre os dados do PPBio

Usaremos ao longo desse livro dados que fazem parte de um estudo mais amplo sobre ecologia de rios do semiárido, coletados no Programa de Pesquisa em Biodiversidade - PPBio (Veja Programa de Pesquisa em Biodiversidade – PPBio). Parte desses dados está armazenada em planilhas de Excel ppbio**.xlsx (Figura 1). Essas matrizes de dados são descritas na Tabela 1. As planilhas ppbio**.xlsx contém vários tipos de dados arranjados em matrizes n x m que incluem dados de abundância de espécies em diferentes unidades amostrais (UA’s), dados da estrutura do habitat físico, e variáveis em escala de bacia hidrográfica, dados de contagem de indivíduos ajustados para Captura Por Unidade de Esforço (CPUE), etc (Figura 1).

Figura 1: Parte da planilha de dados brutos do PPBio.

Por exemplo, essa é a matriz bruta de dados, porque os valores ainda não foram ajustados para os valores de Captura Por Unidade de Esforço (CPUE), nem foram relativizados ou transformados. Outros tipos de arquivos existem sobre esses dados (Tabela 1).

Várias das espécies nessa matriz tem grande importância ecológica, como é o caso de Astyanax bimaculatus1 (Figura 2), que é muito comum em rios intermitentes e serve de alimento para predadores maiores (Silva et al. 2018) como a espécie Hoplias malabaricus2 (Figura 3) (Silva et al. 2010).

Figura 2: Astyanax bimaculatus, a espécie mais comum da matriz de dados ppbio. Peru, by Eakins, R. Fonte: https://www.fishbase.se/summary/Astianax-bimaculatus.html

Figura 3: Hoplias malabaricus, espécie que cresce para se tornar um importante predador. Brazil, by Roselet, F.F.G. Fonte: https://www.fishbase.se/summary/Hoplias-malabaricus.html

Outras espécies como Apareiodon hasemani3 (Figura 4) tem importância trófica por estar na base da cadeia alimentar, enquanto espécies da família Loricariidae, como Pseudancistrus genisetiger4 (Figura 5), tem importância para taxonomia.

Figura 4: Apareiodon sp., importante espécie bentopelágica das bacias dos rios Jaguaribe e Paraíba. Brazil, by Ramos, T.P.A. Fonte: https://www.fishbase.se/summary/Apareiodon-davisi.html

Figura 5: Pseudancistrus genisetiger, uma espécie endêmica das bacias hidrográfcas do nordeste. By Medeiros, E.S.F. Fonte: Arquivo pessoal

As planilhas ppbio**.xlsx contém o delineamento amostral de um dos estudos do Projeto PPBio (Figura 6). Nas linhas são apresentadas as abreviações dos nomes das unidades amostrais (UA’s) e nas colunas são apresentados os nomes abreviados das espécies - temos portando uma matriz comunitária (Tabela 1). No corpo da planilha temos os valores para o tipo de dados amostrado. Quantitativo, semi-quatitativo ou qualitativo.
Qual desses tipos de dados você acha que é apresentado na planilha?

Figura 6: Associação entre a planilha de dados brutos do PPBio e o delineamento amostral do estudo.

3 Arquivos disponíveis

A seguir, apresento uma tabela com as informações essenciais sobre as matrizes de dados que serão utilizadas ao longo deste livro (Tabela 1). Nela, estão descritos os diferentes tipos de matrizes, suas finalidades analíticas e o tipo de dado para cada uma delas. Essas informações servirão de referência para compreender a origem, a estrutura e o tratamento recomendado para os dados empregados nas análises subsequentes.

Você pode baixar essas matrizes clicando no link para o arquivo em .xlsx na coluna Arquivo. Ao vizualizar a matriz que deseja baixar, clique em Arquivo > Baixar > Microsoft Excel (.xlsx). Atente para a pasta onde seu computador baixa o arquivo desejado, você vai precisar dessa informação depois.

Tabela 1: Matrizes disponíveis para análises, com suas descrições e tipos de dados recomendados.
Arquivo (.xlsx) Tipo de matriz Descrição Tipo de dados
Matriz comunitária O arquivo ppbio06 traz os dados brutos que serão usados nas análises. A matriz de dados brutos contendo 26 localidades em estações do ano diferentes (objetos) x 35 espécies (atributos), antes de qualquer modificação. Contagens de indivíduos com alta amplitude de variação, sugerido uso de matriz relativizada.
Matriz ambiental O arquivo ppbio06h traz os dados brutos que serão usados nas análises. A matriz de dados brutos contendo 26 localidades em estações diferentes (objetos) x 35 variáveis ambientais (atributos) medidas em diferentes escalas espaciais, antes de qualquer modificação. Unidades de medição diferentes (cm, m, °C, mg/L, etc.), com alta amplitude de variação, sugerido uso de matriz transformada e/ou reescalada.
Matriz de grupos O arquivo ppbio06 traz os dados brutos que serão usados nessa análise. A matriz de dados brutos contendo 26 locais/ocasiões (objetos) x 35 espécies (atributos), antes de qualquer modificação. Contagens de indivíduos com alta amplitude de variação, sugerido uso de matriz relativizada.

ppbio06-cpue

Matriz comunitária O arquivo ppbio06cpue traz os valores após ajuste pela Captura Por Unidade de Esforço (CPUE). Densidades de indivíduos com alta amplitude de variação, sugerido uso de matriz relativizada.

3.1 Codificação das variáveis

Os arquivos da base de dados do projeto são fornecidos em formato Excel (.xlsx). Por exemplo, o arquivo ppbio06-*.xlsx, traz os dados brutos que serão usados nas análises. A matriz de dados brutos contem mais de 20 localidades (m=linhas ou objetos) em estações do ano diferentes, e cerca de 35 espécies (n=colunas ou atributos), antes de qualquer modificação. Portando é uma matriz bruta. Os valores são contagens de indivíduos, e apresentam uma alta amplitude de variação, portanto, o uso de uma matriz relativizada é sugerido (Tabela 1). Nos nomes dos objetos e dos atributos são codificados de acordo com a tabela mostrada na Figura 7).

Figura 7: Codificação para as variáveis, espécies de peixes, sítios de amostragem e período de amostragem.

3.2 Abreviações

No interesse de sistematizar o código R das várias matrizes que são comumente usadas em uma AMD, a Tabela 2, a seguir, resume seus tipos e abreviações.

Tabela 2: Nomenclatura das matrizes em AMD em relação aos atributos das colunas e suas abreviações nos códigos do R.
Nome Atributos (colunas) Abreviação no R
Matriz comunitaria Os atributos são táxons ou OTU's (Unidades Taxonômicas Operacionais) (ex. espécies, gêneros, morfotipos) m_com
Matriz ambiental Os atributos são dados ambientais e variáveis físicas e químicas (ex. pH, condutividade, temperatura) m_amb
Matriz de habitat Os atributos são elementos da estrutura do habitat (ex. macróficas, algas, pedras, lama, etc) m_hab
Matriz bruta Os atributos ainda não receberam nenhum tipo de tratamento estatísco (valores brutos, como coletados) m_bruta
Matriz transposta Os atributos foram transpostos para as linhas m_t
Matriz relativizada Os atributos foram relativizados por um critério de tamanho ou de variação (ex. dividir os valores de cada coluna pela soma) m_rel, m_relcol, m_rellin
Matriz transformada Foi aplicado um operador matemático a todos os atributos (ex. raiz quadrada, log) m_trns, m_log10, m_asrq
Matriz de distâncias Matriz de m x m similaridades ou de distâncias (ex. Euclidiana, Manhattan, Bray-Curtis, etc) m_dists, m_euclid, m_bray
Matriz de trabalho Qualquer matriz que seja o foco da análise atual (ex. comunitária, relativizada, etc) m_trab
Matriz particionada Foram removidas linhas ou colunas (ex. linhas que são outliers e espécies zeradas) m_part
Base de dados Arquivo do Excel planilhado a partir de dados de campo ou de laboratório. Será manejada e particionada no R, para criar a Matriz bruta ppbio06.xlsx, zoorebio.xlsx, bentos06.xlsx

Referências

Silva, E. P. da, M. R. N. Duarte, e E. S. F. Medeiros. 2018. Relação peso-comprimento de duas espécies de peixes em um rio intermitente no nordeste do Brasil. Neotropical Biology and Conservation 13.
Silva, M. J., B. R. S. Figueiredo, R. T. C. Ramos, e E. S. F. Medeiros. 2010. Food resources used by three species of fish in the semi-arid region of Brazil. Neotropical Ichthyology 8:825–833.

Apêndices

Sites para consulta

Script limpo

Notas de rodapé

  1. A etimologia do gênero Astyanax vem da mitologia Grega. Heitor personagem da “Ilíada”, tinha um filho chamado Astíanax.↩︎

  2. Do Grego, hoplon, arma ou armadura, em referência aos dentes caniniformes muito desenvolvidos, e forte estrutura óssea na cabeça.↩︎

  3. A etimologia do nome Apareiodon vem do Grego, a, sem, pareia, lateral ou bochecha, e odous dentição, em referência a ausência de dentes laterais no aparato bucal dessa espécie.”↩︎

  4. A etimologia do nome Pseudancistrus vem do Grego, pseudes, falso, e agkistron, gancho, em referência a falsos ganchos presentes na cabeça em algumas espécies do gênero.↩︎